#!/usr/bin/env python3
# -*- coding: utf-8 -*-

"""
民宿价格预测项目运行脚本
作者：金旭
"""

import pandas as pd
import numpy as np
import os

def main():
    print("🏠 民宿价格预测项目")
    print("=" * 50)
    
    # 数据文件路径
    train_path = "f23016423_金旭/训练集.csv"
    test_path = "f23016423_金旭/测试集.csv"
    
    try:
        # 加载数据
        print("📂 正在加载数据...")
        train = pd.read_csv(train_path)
        test = pd.read_csv(test_path)
        
        print("✅ 数据加载成功！")
        print(f"训练集形状: {train.shape}")
        print(f"测试集形状: {test.shape}")
        
        # 显示基本信息
        print("\n📊 数据集信息:")
        print(f"训练集列名: {list(train.columns)}")
        
        if '价格' in train.columns:
            print(f"\n💰 价格统计信息:")
            print(f"  最小值: {train['价格'].min():.2f}")
            print(f"  最大值: {train['价格'].max():.2f}")
            print(f"  平均值: {train['价格'].mean():.2f}")
            print(f"  中位数: {train['价格'].median():.2f}")
            print(f"  样本数量: {len(train)}")
        
        # 显示测试集信息
        print(f"\n🧪 测试集信息:")
        print(f"  特征数量: {test.shape[1]}")
        print(f"  样本数量: {len(test)}")
        
        print("\n🎯 数据准备完成！可以开始模型训练。")
        
        # 建议下一步
        print("\n💡 下一步建议:")
        print("1. 运行 Jupyter notebook 进行详细分析")
        print("2. 使用 LightGBM 或 XGBoost 进行价格预测")
        print("3. 分析特征重要性")
        print("4. 生成预测结果文件")
        
    except FileNotFoundError:
        print(f"❌ 错误: 找不到数据文件")
        print(f"请检查以下文件是否存在:")
        print(f"- {train_path}")
        print(f"- {test_path}")
    except Exception as e:
        print(f"❌ 加载数据时出错: {e}")

if __name__ == "__main__":
    main()